seals(海狮与海狗有什么区别)
资讯
2023-11-28
79
1. seals,海狮与海狗有什么区别?
海 豹 海豹即“斑海豹”。哺乳纲、鳍足目、海豹科。体长约1.5米,尾短,前、后肢均呈鳍状,适于水中生活。主食鱼类,也吃甲壳类和贝类。大部分时间生活在海中,而产仔、哺乳、交配和换毛时则在陆地或冰块上。产于温带和寒带的沿海地方。 海 狮 海狮吼声如狮,且个别种颈部长有鬃毛,又颇像狮子,故而得名。它的四脚像鳍,很适于在水中游泳。海狮的后脚能向前弯曲,使它既能在陆地上灵活行走,又能像狗那样蹲在地上。而海豹的后肢却是恒向后伸,不能朝前弯曲,故不能在陆地上步行。虽然海狮有时上陆,但海洋才是它真正的家,只有在海里它才能捕到食物、避开敌人,因此一年中的大部分时间,它们都在海上巡游觅食。 海狮主要以鱼类和乌贼等头足类为食。它的食量很大,如身体粗壮的北海狮,在饲养条件下一天喂鱼最多达 40公斤,一条1.5公斤重的大鱼它可一吞而下。若在自然条件下,每天的摄食量要比在饲养条件下增加2倍~3倍。 海象 在众多的海洋动物中,海象是最出色的潜水能手。 海象一般能在水中潜游20分钟,潜水深度达500米,个别的海象,可潜人创纪录的1500米的深水层,大大超过了 一般军用潜艇,后者至多可下潜 300米。海象在潜入海底后,可在水下滞留2小时,一旦需要新鲜空气,只需3分钟 就能浮出水面,而且无需减压过程。 海象之所以具有如此惊人的潜水本领,主要得益于它体内极为丰富的血液。一头体重2-4吨的海象,血液占整个 体重的20%。而人类的血液,仅占体重的7%,比海象少了近2/3。由于海象体内血液多,含氧量也多,在海洋中下潜 的深度大、时间长也就不足为奇了。 海 狗 海狗是生活在海洋里四脚哺乳动物,因其体型象狗,因此得名海狗;由于又有些象熊,因而又名海熊。其实,海狗与海狮亲缘关系很近,都属于海狮大家族。 海狗的身体呈纺锤型,头圆嘴短,有小耳壳,眼睛较大。海沟的四肢因长期生活在水里,变成了鳍状,适合于游泳。海狗的游泳技术非常高,时速可达30千米左右,潜水本领更高,可潜入100多米的深水处。海狗在游泳时,后肢在水中方向朝后,起舵的作用;上岸后则可当向前方,利用四肢缓慢地爬行,显示得笨拙可笑。
![seals(海狮与海狗有什么区别)](/static/artimg/20231104/6545788350626.jpg)
2. 副词形式怎么写?
relief副词是relievedly
re
lief
再+举, 升
举起一部分→整体变轻→减轻
[rɪˈlif]
【释义】
基本释义 n. 宽慰
常考释义 n.轻松;宽慰
【变形】
复数:reliefs
详细释义
n. 轻松;宽慰;安心;解脱
【Official例句】
1. Well, that's a big relief.(Official28-C2)
这样就太安慰了。
2. When rolled over a soft material----primarily the clay of bullae (round seals), tablets, or clay lumps attached to boxes, jars, or door bolts----the scene would appear in relief, easily legible.(Official27-P1)
当它滚过柔软的材料的时候---主要是被连接在箱子,罐子或是门栓上的粘土圆章,纪念碑,泥土块--- 这个场景就会清晰简单的出现在上面了。
3. Oh, good, that’s a relief. (Official3-C2)
哦,不错,我就松一口气了
3. sealclubbing什么意思?
seal clubbing 海豹clubbing 英[ˈklʌbɪŋ] [词典] 拖锚; [例句]Clubbing baby seals to death for their pelts is wrong.为了获得海豹皮而用棍棒打死幼海豹是不道德的。[其他] 原型: club
4. 大众速腾内顶怎么拆?
拆卸大众速腾车内顶需要谨慎操作,以避免损坏内饰和附件。以下是一般的拆卸步骤:
1. 首先,将车辆的后备厢门打开,并寻找夹板的固定螺母。拧动螺母,卸下夹板。
2. 然后,拆下尾部德国标志前的塑料盖,暴露出一个扣簧和一个拧扣头。
3. 拉出顶部的后座椅头枕,找到并卸下隐藏在座位头枕之后的两个 T30 螺母。
4. 将司机和副驾驶座椅向前调整,以便进一步操作。
5. 拆下原车天窗的饰板,并用扳手拆下螺钉轴承。
6. 用塑料扒子拆下顶部的 A 柱饰板和 B 柱饰板。
7. 将车顶灯灯罩拿下,然后卸下灯具。
8. 拆下后视镜和仪表板两侧的饰板。
9. 温柔地抽出车内顶板。在拆卸之前,先检查是否还有隐藏的螺丝或夹子。
注意,拆下车内顶板时应该谨慎操作,避免强力拉扯或损坏正常的固定部件。如果您不是专业维修人员,请在保证安全的情况下谨慎操作或寻求专业技术支持。
5. AlphaZero是一次真正的AI突破吗?
近日,Jose Camacho Collados 在 Medium 上发表了一篇题为《Is AlphaZero really a scientific breakthrough in AI?》的文章,对 AlphaZero 在 AI 领域的真正的科学价值提出质疑。作者本人是一名自然语言处理专家,同时精通国际象棋。他认为当下媒体对 AlphaZero 的壮举存在夸大之嫌,因此作者从可用性/可复现性、4 小时训练、自我对弈、通用性等多方面表达了疑虑,所有的疑虑聚合到一起形成了对 AlphaZero 的科学有效性的合理质疑。
DeepMind 最近发表了一篇关于 AlphaZero [1] 的论文,介绍了一个通过自我学习掌握国际象棋或将棋的系统。
进入正文之前,我首先做个自我介绍。我是一名人工智能领域研究者,方向是自然语言处理;我同样也是一名国际象棋大师,目前是韩国的顶尖选手,但是由于我全职科研最近几年不是很活跃。因此,我会尽力提出一个合理的、有建设性的观点。很明显我会着重讲国际象棋,但是一些论点是通用的,可推算至将棋或围棋。
国际象棋可以说是在「人机对战」和人工智能中研究最为广泛的游戏。该领域的首个突破是 1997 年 IBM 深蓝(Deep Blue)击败世界冠军 Garry Kasparov [2]。在此之前,人们普遍认为在国际象棋上机器不如人,但自深蓝胜利以后,人与机器的国际象棋之争已胜负分明。
Garry Kasparov 对战 IBM 深蓝,1997。
2016 年,DeepMind 推出围棋引擎 AlphaGo,可击败一些人类顶尖围棋选手 [3]。值得注意的是围棋的复杂性要远高于国际象棋,正由于此,尽管计算机的算力有了很大提升,但机器依然无法在围棋上战胜人类。因此,AlphaGo 被认为是一次突破。AlphaGo Zero 在 AlphaGo 的基础上更进一步,可通过完全自我对弈掌握围棋 [4]。最近出现的 AlphaZero 是一个类似的模型,通过通用强化学习算法训练神经网络架构,并击败了最好的将棋和国际象棋引擎 [1]。
AlphaZero 的壮举已被大众媒体 [5,6] 和国际象棋媒体 [7,8] 大量报道,其中不乏对其突破的过分夸大。然而,通过仔细地阅读 AlphaZero 的论文,我认为确实存在对其重要声明有效性的合理质疑。有些质疑本身可能并不重要,并且作者可能也做出了解释。但即便如此,所有的疑虑聚合到一起就形成了对其主要声明的科学有效性的合理质疑。以下列举了一些普遍的疑虑:
可用性/可复现性。DeepMind 开发的 AlphaZero 系统都没有对公众开放:代码没有开源,甚至都没有一个商业版本让用户进行测试。这是一个很大的阻碍,因为从科学角度看,这些方法既不能被验证也不能被其他专家利用。这种缺乏透明度的做法使他们的实验基本不可能被复现。
4 小时训练。AlphaZero 的训练量成为最难理解的因素之一。根据论文,AlphaZero 在 5000 个 TPU 上训练了 4 个小时,就达到了超越开源国际象棋引擎 Stockfish 的级别(充分训练的 AlphaZero 需要再多几个小时的训练)。这意味着如果仅使用一块 TPU,AlphaZero 需要花费大约两年的训练时间,这个训练时间大大超过了使用一块普通 CPU 的训练时间。因此,即使 4 小时训练时间给我们留下深刻的印象(确实很深刻),这也主要是近几年算力得到极大发展的功劳,特别是像 DeepMind 这样对算力进行大量投资的公司。例如,到 2012 年,7 格以内的所有象棋位置已经可以使用数学方法和少得多的计算资源求解 [9]。计算能力的提升为新算法的开发铺平了道路,可能几年后国际象棋这样的游戏甚至可以使用暴力求解方法来解决。
和 Stockfish 的实验设置的对比。为了证明 AlphaZero 相对于以前的国际象棋引擎的优越性,DeepMind 进行了 AlphaZero 对战 Stockfish 的 100 次比赛(AlphaZero 以 64:36 打败了 Stockfish)。Stockfish 的版本选择看起来是挺合理的,开源的并且是目前最强大的国际象棋引擎。Stockfish 在最近的顶级国际象棋引擎竞赛(TCEC,被视为国际象棋引擎的世界锦标赛)中取得了第三名(在 Komodo 和 Houdini 之后)[10]。然而,其中的实验设置看起来并不公平。他们使用的 Stockfish 版本并不是最新的,更重要的是,它是在一个普通 PC 上运行的,而 AlphaZero 使用的计算能力要强大的多。例如,在 TCEC 中所有的竞赛引擎都必须使用相同的处理器进行比赛。此外,对时间的选择看起来很奇怪。每一个引擎被设置成每一步一分钟的思考时间。然而,人类竞赛和引擎竞赛大部分都是设置成为每个玩家分配整个比赛的固定时间,这个时间由玩家自行管理。正如 Stockfish 的最初开发者之一 Tord Romstad 指出,这是危害 Stockfish 的另一项可疑的决定,「Stockfish 需要花费大量的算力用于鉴别游戏中的关键点,以及在走棋中决定什么时候使用额外的时间 [10]。」并且,AlphaZero 对战 Stockfish 的超高胜率使某些顶尖的国际象棋选手非常惊讶,它挑战了关于国际象棋引擎已经达到了不可打败的强度的普遍观念(例如,世界排名第九的 Hikaru Nakamura,质疑了 AlphaZero 对战 Stockfish 的低平局率 [11])。
和 Stockfish 的 10 局比赛。DeepMind 的论文只分享了 10 场比赛样本,10 场全是 AlphaZero 取得胜利 [12]。由于 AlphaZero 展示出的对象棋的「深度理解」,这些比赛获得了象棋社区的一致赞扬:Peter-Heine Nielsen [13],象棋特级大师、世界冠军 Magnus Carlsen 的教练;Maxime Vachier Lagrave [11],世界排名第五的象棋选手,二者均对 AlphaZero 在和 Stockfish 比赛中的表现做出了积极回应。在科技论文中展示提出系统出现缺点或表现不太好的示例是一种惯例,以使大家对该系统有一个全局性了解,也便于其他研究者基于此进行进一步研究。该论文另一个不明确的地方时比赛是从特定的开局开始还是从头开始。这 10 场比赛中出现了大量不同开局,似乎初始棋局是预先确定好的。
AlphaZero 和 Stockfish 的比赛。最后一手:26. Qh1! 象棋特级大师 Francisco Vallejo Pons 称这场比赛像『科幻小说』。
自我对弈。AlphaZero 完全从自我对弈中学习的吗?根据论文提供的细节来看是这样的,但有两个重要的地方需要注意:在开始自我对弈之前必须先教会系统游戏规则和通常手数。这一点并不像看上去那么无足轻重。要寻找可以编码规则的合适的神经网络架构必须投入大量研究,正如 AlphaZero 论文中解释的那样。AlphaGo 使用的基于卷积神经网络的架构适合围棋,但不适合其他游戏。例如,象棋和将棋就和围棋不同,它们是不对称的,一些棋子根据自身位置进行不同的操作。最新的 AlphaZero 引入了更通用的 AlphaGo 算法版本,适用于象棋和将棋。第二点(即教会 AlphaZero 棋类游戏的通常手数)还要求游戏的一些先验知识。此外,超出最大步数的游戏的结果被定为平局(DeepMind 未提供最大步数的信息)。现在不清楚这种启发式方法是否也用于对抗 Stockfish 的比赛中,还是只用于训练。
通用性。AlphaZero 称其使用了可在多个领域中获胜的通用强化学习方法。但是,在前面关于自我对弈的观点之后,也出现大量争论关于 AlphaGo 和 AlphaZero 系统泛化至其他领域的能力 [14]。现实生活的很多场景可以被简化成固定的预制规则集,像围棋、象棋、将棋那样,这似乎不切实际。此外,这些游戏不仅具备固定的规则集,而且是有限的,即可能的配置情况是有限的,尽管它们的复杂程度各有不同。这和其他也有固定规则集的游戏不一样。比如,网球中需要考虑的变量很难量化,必须考虑速度和风向、球速、球和球面的角度、球面类型、球拍材质、场地问题等。
我们应该科学、审慎地观察这些所谓的突破,尤其是在现在这个 AI 炒作的时代。准确地描述和推广我们的成就是该领域研究者的责任,不要助长不实信息,把该领域神秘化。事实上,在月初的 NIPS 大会上,一些研究者表达了对近年来该科学领域缺乏严谨性的担忧 [15]。
在这种情况下,我希望这些担忧能够得到解决,准确地评估 AlphaZero 的实际科学贡献,而这一判断并不是现在就能做出的。或许如果有更好的实验设计和对复现的考虑,DeepMind 的结论就没有现在那么让人震惊了,也可能不是。但是很难对此做出评估,除非 DeepMind 真的在这方面做出努力。我个人非常希望 DeepMind 在 AI 领域实现更多相关发现,但是我也希望这些成绩的取得是以一种同行可以轻松评价且对社会有所贡献的方式进行。
参考资料
[1] Silver et al.「Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm.」arXiv preprint arXiv:1712.01815 (2017). https://arxiv.org/pdf/1712.01815.pdf
[2] https://en.wikipedia.org/wiki/Deep_Blue_versus_Garry_Kasparov
[3] https://www.theguardian.com/technology/2016/mar/15/googles-alphago-seals-4-1-victory-over-grandmaster-lee-sedol
[4] Silver et al.「Mastering the game of go without human knowledge.」Nature 550.7676 (2017): 354–359. https://www.gwern.net/docs/rl/2017-silver.pdf
[5] https://www.theguardian.com/technology/2017/dec/07/alphazero-google-deepmind-ai-beats-champion-program-teaching-itself-to-play-four-hours
[6] http://www.bbc.com/news/technology-42251535
[7] https://chess24.com/en/read/news/deepmind-s-alphazero-crushes-chess
[8] https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
[9] http://chessok.com/?page_id=27966
[10] https://hunonchess.com/houdini-is-tcec-season-10-champion/
[11] https://www.chess.com/news/view/alphazero-reactions-from-top-gms-stockfish-author
[12] Link to reproduce the 10 games of AlphaZero against Stockfish: https://chess24.com/en/watch/live-tournaments/alphazero-vs-stockfish/1/1/1
[13] https://www.twitch.tv/videos/207257790
[14] https://medium.com/@karpathy/alphago-in-context-c47718cb95a5
[15] Ali Rahimi compared current Machine Learning practices with「alchemy」in his talk at NIPS 2017 following the reception of his test of time award: https://www.youtube.com/watch?v=ORHFOnaEzPc
6. 三贵情史一吻定情是什么意思?
《三贵情史一吻定情》是一部电影的中文译名,原名为 "Three Amigos: A Kiss Seals the Deal"。这部电影是一部喜剧片,讲述了三个好朋友的冒险故事。"一吻定情"意味着在电影中,主人公通过一个吻来解决问题,达成共识或者改变命运。
这个片名传达了一个浪漫而有趣的情节,暗示了吻的力量和影响。
这个片名也可能暗示着爱情的力量,以及爱情可以改变人们的生活和关系。总之,这个片名传达了电影中浪漫、喜剧和情感的元素。
7. 北极英语作文20词?
1 polar bear is giant,furry,white.it is a specie of bear.i think it's the largest type of bear.
2 similar characteristics with brown bear except it has a longer spinal and larger body mass.i think.
3 it lives in the arctic,valuable to indigenous culture.
4 polar bear hunts seals,adapted to cold temperature,it's kind of vicious and normall it'll attack human.
本站涵盖的内容、图片、视频等数据系网络收集,部分未能与原作者取得联系。若涉及版权问题,请联系我们删除!联系邮箱:ynstorm@foxmail.com 谢谢支持!
1. seals,海狮与海狗有什么区别?
海 豹 海豹即“斑海豹”。哺乳纲、鳍足目、海豹科。体长约1.5米,尾短,前、后肢均呈鳍状,适于水中生活。主食鱼类,也吃甲壳类和贝类。大部分时间生活在海中,而产仔、哺乳、交配和换毛时则在陆地或冰块上。产于温带和寒带的沿海地方。 海 狮 海狮吼声如狮,且个别种颈部长有鬃毛,又颇像狮子,故而得名。它的四脚像鳍,很适于在水中游泳。海狮的后脚能向前弯曲,使它既能在陆地上灵活行走,又能像狗那样蹲在地上。而海豹的后肢却是恒向后伸,不能朝前弯曲,故不能在陆地上步行。虽然海狮有时上陆,但海洋才是它真正的家,只有在海里它才能捕到食物、避开敌人,因此一年中的大部分时间,它们都在海上巡游觅食。 海狮主要以鱼类和乌贼等头足类为食。它的食量很大,如身体粗壮的北海狮,在饲养条件下一天喂鱼最多达 40公斤,一条1.5公斤重的大鱼它可一吞而下。若在自然条件下,每天的摄食量要比在饲养条件下增加2倍~3倍。 海象 在众多的海洋动物中,海象是最出色的潜水能手。 海象一般能在水中潜游20分钟,潜水深度达500米,个别的海象,可潜人创纪录的1500米的深水层,大大超过了 一般军用潜艇,后者至多可下潜 300米。海象在潜入海底后,可在水下滞留2小时,一旦需要新鲜空气,只需3分钟 就能浮出水面,而且无需减压过程。 海象之所以具有如此惊人的潜水本领,主要得益于它体内极为丰富的血液。一头体重2-4吨的海象,血液占整个 体重的20%。而人类的血液,仅占体重的7%,比海象少了近2/3。由于海象体内血液多,含氧量也多,在海洋中下潜 的深度大、时间长也就不足为奇了。 海 狗 海狗是生活在海洋里四脚哺乳动物,因其体型象狗,因此得名海狗;由于又有些象熊,因而又名海熊。其实,海狗与海狮亲缘关系很近,都属于海狮大家族。 海狗的身体呈纺锤型,头圆嘴短,有小耳壳,眼睛较大。海沟的四肢因长期生活在水里,变成了鳍状,适合于游泳。海狗的游泳技术非常高,时速可达30千米左右,潜水本领更高,可潜入100多米的深水处。海狗在游泳时,后肢在水中方向朝后,起舵的作用;上岸后则可当向前方,利用四肢缓慢地爬行,显示得笨拙可笑。
2. 副词形式怎么写?
relief副词是relievedly
re
lief
再+举, 升
举起一部分→整体变轻→减轻
[rɪˈlif]
【释义】
基本释义 n. 宽慰
常考释义 n.轻松;宽慰
【变形】
复数:reliefs
详细释义
n. 轻松;宽慰;安心;解脱
【Official例句】
1. Well, that's a big relief.(Official28-C2)
这样就太安慰了。
2. When rolled over a soft material----primarily the clay of bullae (round seals), tablets, or clay lumps attached to boxes, jars, or door bolts----the scene would appear in relief, easily legible.(Official27-P1)
当它滚过柔软的材料的时候---主要是被连接在箱子,罐子或是门栓上的粘土圆章,纪念碑,泥土块--- 这个场景就会清晰简单的出现在上面了。
3. Oh, good, that’s a relief. (Official3-C2)
哦,不错,我就松一口气了
3. sealclubbing什么意思?
seal clubbing 海豹clubbing 英[ˈklʌbɪŋ] [词典] 拖锚; [例句]Clubbing baby seals to death for their pelts is wrong.为了获得海豹皮而用棍棒打死幼海豹是不道德的。[其他] 原型: club
4. 大众速腾内顶怎么拆?
拆卸大众速腾车内顶需要谨慎操作,以避免损坏内饰和附件。以下是一般的拆卸步骤:
1. 首先,将车辆的后备厢门打开,并寻找夹板的固定螺母。拧动螺母,卸下夹板。
2. 然后,拆下尾部德国标志前的塑料盖,暴露出一个扣簧和一个拧扣头。
3. 拉出顶部的后座椅头枕,找到并卸下隐藏在座位头枕之后的两个 T30 螺母。
4. 将司机和副驾驶座椅向前调整,以便进一步操作。
5. 拆下原车天窗的饰板,并用扳手拆下螺钉轴承。
6. 用塑料扒子拆下顶部的 A 柱饰板和 B 柱饰板。
7. 将车顶灯灯罩拿下,然后卸下灯具。
8. 拆下后视镜和仪表板两侧的饰板。
9. 温柔地抽出车内顶板。在拆卸之前,先检查是否还有隐藏的螺丝或夹子。
注意,拆下车内顶板时应该谨慎操作,避免强力拉扯或损坏正常的固定部件。如果您不是专业维修人员,请在保证安全的情况下谨慎操作或寻求专业技术支持。
5. AlphaZero是一次真正的AI突破吗?
近日,Jose Camacho Collados 在 Medium 上发表了一篇题为《Is AlphaZero really a scientific breakthrough in AI?》的文章,对 AlphaZero 在 AI 领域的真正的科学价值提出质疑。作者本人是一名自然语言处理专家,同时精通国际象棋。他认为当下媒体对 AlphaZero 的壮举存在夸大之嫌,因此作者从可用性/可复现性、4 小时训练、自我对弈、通用性等多方面表达了疑虑,所有的疑虑聚合到一起形成了对 AlphaZero 的科学有效性的合理质疑。
DeepMind 最近发表了一篇关于 AlphaZero [1] 的论文,介绍了一个通过自我学习掌握国际象棋或将棋的系统。
进入正文之前,我首先做个自我介绍。我是一名人工智能领域研究者,方向是自然语言处理;我同样也是一名国际象棋大师,目前是韩国的顶尖选手,但是由于我全职科研最近几年不是很活跃。因此,我会尽力提出一个合理的、有建设性的观点。很明显我会着重讲国际象棋,但是一些论点是通用的,可推算至将棋或围棋。
国际象棋可以说是在「人机对战」和人工智能中研究最为广泛的游戏。该领域的首个突破是 1997 年 IBM 深蓝(Deep Blue)击败世界冠军 Garry Kasparov [2]。在此之前,人们普遍认为在国际象棋上机器不如人,但自深蓝胜利以后,人与机器的国际象棋之争已胜负分明。
Garry Kasparov 对战 IBM 深蓝,1997。
2016 年,DeepMind 推出围棋引擎 AlphaGo,可击败一些人类顶尖围棋选手 [3]。值得注意的是围棋的复杂性要远高于国际象棋,正由于此,尽管计算机的算力有了很大提升,但机器依然无法在围棋上战胜人类。因此,AlphaGo 被认为是一次突破。AlphaGo Zero 在 AlphaGo 的基础上更进一步,可通过完全自我对弈掌握围棋 [4]。最近出现的 AlphaZero 是一个类似的模型,通过通用强化学习算法训练神经网络架构,并击败了最好的将棋和国际象棋引擎 [1]。
AlphaZero 的壮举已被大众媒体 [5,6] 和国际象棋媒体 [7,8] 大量报道,其中不乏对其突破的过分夸大。然而,通过仔细地阅读 AlphaZero 的论文,我认为确实存在对其重要声明有效性的合理质疑。有些质疑本身可能并不重要,并且作者可能也做出了解释。但即便如此,所有的疑虑聚合到一起就形成了对其主要声明的科学有效性的合理质疑。以下列举了一些普遍的疑虑:
可用性/可复现性。DeepMind 开发的 AlphaZero 系统都没有对公众开放:代码没有开源,甚至都没有一个商业版本让用户进行测试。这是一个很大的阻碍,因为从科学角度看,这些方法既不能被验证也不能被其他专家利用。这种缺乏透明度的做法使他们的实验基本不可能被复现。
4 小时训练。AlphaZero 的训练量成为最难理解的因素之一。根据论文,AlphaZero 在 5000 个 TPU 上训练了 4 个小时,就达到了超越开源国际象棋引擎 Stockfish 的级别(充分训练的 AlphaZero 需要再多几个小时的训练)。这意味着如果仅使用一块 TPU,AlphaZero 需要花费大约两年的训练时间,这个训练时间大大超过了使用一块普通 CPU 的训练时间。因此,即使 4 小时训练时间给我们留下深刻的印象(确实很深刻),这也主要是近几年算力得到极大发展的功劳,特别是像 DeepMind 这样对算力进行大量投资的公司。例如,到 2012 年,7 格以内的所有象棋位置已经可以使用数学方法和少得多的计算资源求解 [9]。计算能力的提升为新算法的开发铺平了道路,可能几年后国际象棋这样的游戏甚至可以使用暴力求解方法来解决。
和 Stockfish 的实验设置的对比。为了证明 AlphaZero 相对于以前的国际象棋引擎的优越性,DeepMind 进行了 AlphaZero 对战 Stockfish 的 100 次比赛(AlphaZero 以 64:36 打败了 Stockfish)。Stockfish 的版本选择看起来是挺合理的,开源的并且是目前最强大的国际象棋引擎。Stockfish 在最近的顶级国际象棋引擎竞赛(TCEC,被视为国际象棋引擎的世界锦标赛)中取得了第三名(在 Komodo 和 Houdini 之后)[10]。然而,其中的实验设置看起来并不公平。他们使用的 Stockfish 版本并不是最新的,更重要的是,它是在一个普通 PC 上运行的,而 AlphaZero 使用的计算能力要强大的多。例如,在 TCEC 中所有的竞赛引擎都必须使用相同的处理器进行比赛。此外,对时间的选择看起来很奇怪。每一个引擎被设置成每一步一分钟的思考时间。然而,人类竞赛和引擎竞赛大部分都是设置成为每个玩家分配整个比赛的固定时间,这个时间由玩家自行管理。正如 Stockfish 的最初开发者之一 Tord Romstad 指出,这是危害 Stockfish 的另一项可疑的决定,「Stockfish 需要花费大量的算力用于鉴别游戏中的关键点,以及在走棋中决定什么时候使用额外的时间 [10]。」并且,AlphaZero 对战 Stockfish 的超高胜率使某些顶尖的国际象棋选手非常惊讶,它挑战了关于国际象棋引擎已经达到了不可打败的强度的普遍观念(例如,世界排名第九的 Hikaru Nakamura,质疑了 AlphaZero 对战 Stockfish 的低平局率 [11])。
和 Stockfish 的 10 局比赛。DeepMind 的论文只分享了 10 场比赛样本,10 场全是 AlphaZero 取得胜利 [12]。由于 AlphaZero 展示出的对象棋的「深度理解」,这些比赛获得了象棋社区的一致赞扬:Peter-Heine Nielsen [13],象棋特级大师、世界冠军 Magnus Carlsen 的教练;Maxime Vachier Lagrave [11],世界排名第五的象棋选手,二者均对 AlphaZero 在和 Stockfish 比赛中的表现做出了积极回应。在科技论文中展示提出系统出现缺点或表现不太好的示例是一种惯例,以使大家对该系统有一个全局性了解,也便于其他研究者基于此进行进一步研究。该论文另一个不明确的地方时比赛是从特定的开局开始还是从头开始。这 10 场比赛中出现了大量不同开局,似乎初始棋局是预先确定好的。
AlphaZero 和 Stockfish 的比赛。最后一手:26. Qh1! 象棋特级大师 Francisco Vallejo Pons 称这场比赛像『科幻小说』。
自我对弈。AlphaZero 完全从自我对弈中学习的吗?根据论文提供的细节来看是这样的,但有两个重要的地方需要注意:在开始自我对弈之前必须先教会系统游戏规则和通常手数。这一点并不像看上去那么无足轻重。要寻找可以编码规则的合适的神经网络架构必须投入大量研究,正如 AlphaZero 论文中解释的那样。AlphaGo 使用的基于卷积神经网络的架构适合围棋,但不适合其他游戏。例如,象棋和将棋就和围棋不同,它们是不对称的,一些棋子根据自身位置进行不同的操作。最新的 AlphaZero 引入了更通用的 AlphaGo 算法版本,适用于象棋和将棋。第二点(即教会 AlphaZero 棋类游戏的通常手数)还要求游戏的一些先验知识。此外,超出最大步数的游戏的结果被定为平局(DeepMind 未提供最大步数的信息)。现在不清楚这种启发式方法是否也用于对抗 Stockfish 的比赛中,还是只用于训练。
通用性。AlphaZero 称其使用了可在多个领域中获胜的通用强化学习方法。但是,在前面关于自我对弈的观点之后,也出现大量争论关于 AlphaGo 和 AlphaZero 系统泛化至其他领域的能力 [14]。现实生活的很多场景可以被简化成固定的预制规则集,像围棋、象棋、将棋那样,这似乎不切实际。此外,这些游戏不仅具备固定的规则集,而且是有限的,即可能的配置情况是有限的,尽管它们的复杂程度各有不同。这和其他也有固定规则集的游戏不一样。比如,网球中需要考虑的变量很难量化,必须考虑速度和风向、球速、球和球面的角度、球面类型、球拍材质、场地问题等。
我们应该科学、审慎地观察这些所谓的突破,尤其是在现在这个 AI 炒作的时代。准确地描述和推广我们的成就是该领域研究者的责任,不要助长不实信息,把该领域神秘化。事实上,在月初的 NIPS 大会上,一些研究者表达了对近年来该科学领域缺乏严谨性的担忧 [15]。
在这种情况下,我希望这些担忧能够得到解决,准确地评估 AlphaZero 的实际科学贡献,而这一判断并不是现在就能做出的。或许如果有更好的实验设计和对复现的考虑,DeepMind 的结论就没有现在那么让人震惊了,也可能不是。但是很难对此做出评估,除非 DeepMind 真的在这方面做出努力。我个人非常希望 DeepMind 在 AI 领域实现更多相关发现,但是我也希望这些成绩的取得是以一种同行可以轻松评价且对社会有所贡献的方式进行。
参考资料
[1] Silver et al.「Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm.」arXiv preprint arXiv:1712.01815 (2017). https://arxiv.org/pdf/1712.01815.pdf
[2] https://en.wikipedia.org/wiki/Deep_Blue_versus_Garry_Kasparov
[3] https://www.theguardian.com/technology/2016/mar/15/googles-alphago-seals-4-1-victory-over-grandmaster-lee-sedol
[4] Silver et al.「Mastering the game of go without human knowledge.」Nature 550.7676 (2017): 354–359. https://www.gwern.net/docs/rl/2017-silver.pdf
[5] https://www.theguardian.com/technology/2017/dec/07/alphazero-google-deepmind-ai-beats-champion-program-teaching-itself-to-play-four-hours
[6] http://www.bbc.com/news/technology-42251535
[7] https://chess24.com/en/read/news/deepmind-s-alphazero-crushes-chess
[8] https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
[9] http://chessok.com/?page_id=27966
[10] https://hunonchess.com/houdini-is-tcec-season-10-champion/
[11] https://www.chess.com/news/view/alphazero-reactions-from-top-gms-stockfish-author
[12] Link to reproduce the 10 games of AlphaZero against Stockfish: https://chess24.com/en/watch/live-tournaments/alphazero-vs-stockfish/1/1/1
[13] https://www.twitch.tv/videos/207257790
[14] https://medium.com/@karpathy/alphago-in-context-c47718cb95a5
[15] Ali Rahimi compared current Machine Learning practices with「alchemy」in his talk at NIPS 2017 following the reception of his test of time award: https://www.youtube.com/watch?v=ORHFOnaEzPc
6. 三贵情史一吻定情是什么意思?
《三贵情史一吻定情》是一部电影的中文译名,原名为 "Three Amigos: A Kiss Seals the Deal"。这部电影是一部喜剧片,讲述了三个好朋友的冒险故事。"一吻定情"意味着在电影中,主人公通过一个吻来解决问题,达成共识或者改变命运。
这个片名传达了一个浪漫而有趣的情节,暗示了吻的力量和影响。
这个片名也可能暗示着爱情的力量,以及爱情可以改变人们的生活和关系。总之,这个片名传达了电影中浪漫、喜剧和情感的元素。
7. 北极英语作文20词?
1 polar bear is giant,furry,white.it is a specie of bear.i think it's the largest type of bear.
2 similar characteristics with brown bear except it has a longer spinal and larger body mass.i think.
3 it lives in the arctic,valuable to indigenous culture.
4 polar bear hunts seals,adapted to cold temperature,it's kind of vicious and normall it'll attack human.
本站涵盖的内容、图片、视频等数据系网络收集,部分未能与原作者取得联系。若涉及版权问题,请联系我们删除!联系邮箱:ynstorm@foxmail.com 谢谢支持!